Peter Jeffrey McKeown, Dissertation, Fachbereich Physik der Universität Hamburg, 2024 :

"Development and Performance of a Fast Simulation Tool for Showers in High Granularity Calorimeters based on Deep Generative Models"


Der Volltext wurde als Buch/Online-Dokument (ISBN 10.3204/PUBDB-2024-01825) im Verlag Deutsches Elektronen-Synchrotron DESY veröffentlicht.

Summary

Kurzfassung

Für moderne Experimente der Hochenergiehysik sind große Mengen simulierter Daten ein wesentlicher Bestandteil, was erhebliche Anforderungen an die verfügbaren Rechenressourcen stellt. Methoden des maschinellen Lernens, basierend auf generativen Modellen, haben das Potential die Rechenzeit zu reduzieren, welche für die Simulation von Teilchenschauern im Kalorimetersystem erforderlich ist, die den rechenintensivsten Teil einer vollständigen Detektorsimulation darstellt. Diese Arbeit fokussiert sich auf die Entwicklung einer ersten Simulationsanwendung, die auf generativen Modellen für die Schauersimulation in hochgranularen Kalorimetern basiert, und untersucht anschließend dessen Leistung in einer realistischen Detektorgeometrie. Um diese Modelle in einer allgemeinen Simulation anwenden zu können, müssen sie eine geeignete Detektorantwort für Teilchen liefern, die unter verschiedenen Winkeln zum und an verschiedenen Positionen im Detektor einfallen. Entscheidend ist, dass die Güte physikalischer Observablen nach der Rekonstruktion hoch bleibt, was das eigentliche Ziel eines solchen Simulators ist. Wir erweitern zunächst den leistungsstarken Bounded Information Bottleneck Autoencoder (BIB-AE), um Schauer von Photonen unterschiedlicher Einfallsenergien und -winkel zur Oberfläche des elektromagnetischen Kalorimeters des International Large Detector (ILD) zu simulieren, bevor wir die Einzelteilchensimulationsgüte des Modells im Hinblick auf entscheidende kalorimetrische Messgrößen sowohl vor als auch nach der Rekonstruktion untersuchen. Anschließend wird das Modell so erweitert, dass es einen zusätzlichen Einfallswinkel verarbeiten kann, und es werden Schritte unternommen, um geometrische Unregelmäßigkeiten zu berücksichtigen, damit das Modell an verschiedenen Positionen im Kalorimeter eingesetzt werden kann. Als nächsten Schritt beschreiben wir eine generische Programmbibliothek, die die Verwendung von generativen Modellen mit Geant4 und DD4hep ermöglicht und eine vollständige Integration in die üblichen in der Hochenergiephysik verwendeten Softwareumgebungen erlaubt. Wir beschreiben die Integration des BIB-AE in diese Bibliothek, was einen angemessen Benchmark der Rechenleistung des Modells ermöglicht. Anschließend simulieren wir mit dem Modell Schauer an unterschiedlichen Positionen, um die Effekte der Durchführung solcher Simulationen in einer irregulären Kalorimetergeometrie zu untersuchen. Schließlich untersuchen wir die Leistungsfähigkeit des BIB-AE, wenn es in Simulationen von Photonen aus Zerfällen neutraler Pionen im Prozess e+e− → τ+τ− in Bezug auf die wichtigsten physikalischen Observablen verwendet wird. Wir stellen fest, dass gewisse Abweichungen von Geant4 auftreten, diese aber typischerweise mit der Monte-Carlo-Unsicherheit vergleichbar sind, die aus den Ergebnisunterschieden zwischen den Geant4 -Versionen geschätzt wird.

Titel

Kurzfassung

Summary

Modern high energy physics experiments fundamentally rely on large quantities of simulated data, placing significant demands on the available computational resources. Machine learning methods based on deep generative models promise to reduce the compute time required to simulate particle showers in the calorimeter system, which constitutes the most computationally intensive part of a full detector simulation. This work focuses on the development of a first simulation tool based on deep generative models for shower simulation in highly granular calorimeters, and subsequently studies its performance in a realistic detector geometry. In order to apply these models in a general simulation, they must provide a suitable detector response for particles incident under various angles to, and at various positions in, the detector. Crucially, the physics performance after reconstruction must remain high, which is the ultimate target of such a simulator. We initially extend the performant Bounded Information Bottleneck Autoencoder (BIB-AE) to simulate showers from photons with varying incident energy and angle to the surface of the electromagnetic calorimeter of the International Large Detector (ILD), before studying the single particle performance of the model in terms of key calorimetric observables, both before and after reconstruction. We then further extend the model to handle an additional angle of incidence, as well as taking steps to deal with geometry irregularities in order to allow the use of the model at different positions in the calorimeter. As a next step, we describe a generic library that enables the use of generative models with Geant4 and DD4hep, allowing a full integration into standard software ecosystems used in high energy physics. We outline the integration of the BIB-AE into this library, allowing a fair benchmark of the computational performance of the model. We then simulate showers at different positions with the model, in order to investigate the effects of performing simulations in an irregular calorimeter geometry. Finally, we study the performance of the BIB-AE when used to simulate photons from neutral pion decays in the process e+e− → τ+τ− in terms of key physics observables. We find that while some deviations from Geant4 occur, they are typically comparable to the Monte Carlo uncertainty, estimated from the performance differences between Geant4 versions.